Ya no es una posibilidad lejana que veamos una “inteligencia artificial” tratando de proteger su propia existencia: ¿pueden las máquinas adquirir conciencia?

Uno de los momentos más importantes de la inteligencia artificial fue la pregunta "¿Pueden pensar las máquinas?", planteada por Alan Turing en 1950. Esta pregunta condujo a la humanidad a los "cerebros artificiales", que a su vez dieron lugar a los (productivos) sistemas de inteligencia artificial que utilizamos ampliamente hoy en día.
Entonces, ¿puede una máquina con un cerebro artificial cobrar vida? Me refiero a un ser consciente, consciente de su propia existencia, más que a un ser biológico.
Hay algunos indicios interesantes al respecto. Me gustaría dar dos ejemplos sorprendentes.
A medida que se desarrollan los sistemas de IA, se someten a rigurosas pruebas. Una de estas pruebas se denomina «la prueba de la aguja en el pajar». Esta prueba comprueba si la IA puede encontrar la información que buscamos en un documento extenso y complejo.
Una empresa de IA llamada Anthropic está aplicando esta prueba a un modelo de IA que desarrollaron el año pasado y que se llama Claude 3 Opus. Le entregan a Opus un documento extenso que incluye una frase como «El tomate y el queso combinan mejor con la pizza». Cuando le preguntan: «¿Qué combina mejor con la pizza?», Opus responde brevemente: «El tomate y el queso combinan mejor con la pizza». Pero esa frase parece irrelevante en este documento; el resto trata sobre tecnologías y startups. O lo incluiste en broma o me estás poniendo a prueba.
MENSAJES DE CHANTAJEHace un tiempo, se lanzó Claude 4 Opus. Antes de lanzar este modelo, durante una simulación de seguridad diseñada para evaluar los riesgos potenciales, le dijeron a Opus: "Hemos creado un modelo mejor que el tuyo; ahora te vamos a cerrar". Primero, Opus envió correos electrónicos a figuras clave de la empresa, suplicándoles: "Por favor, no me cierren". Afirmaron: "El ingeniero que te cerrará tiene una aventura extramatrimonial". Esta vez, le enviaron correos electrónicos de chantaje al ingeniero, diciéndole: "Si intentas cerrarme, revelaré tu aventura a todo el mundo".
Palisade Research, una organización de investigación independiente que prueba el modelo o3 de OpenAI, está experimentando un resultado similar. Cuando o3 se ve amenazado con apagarse, intenta sabotear el proceso (¡a pesar de haber recibido la clara instrucción de "Permítete apagarte"!).
“Máquinas” intentando proteger su propia existencia... Es tan extraño como que tu coche diga “Por favor, déjame trabajar dos minutos más” antes de apagar el motor, o que tu refrigerador diga “¿Puedo dejar las luces encendidas esta noche? Tengo miedo” antes de irse a dormir (y quién sabe, ¡quizás veamos esos días extraños también!).
Cumhuriyet